如何编写Unicode源代码

  • 标准的C运行期字符串函数,如strcpy、strchr和strcat只能对ANSI字符串进行操作,不能正确的处理Unicode字符串,因此,ANSI C拥有一组补充函数,例如:

    1
    2
    char* strcat(char*, const char*);
    wchar_t* wcscat(wchar_t*, const wchar_T*);

    所有的Unicode函数均以wcs开头,wcs表示宽字符串

  • 如果需要创建同时为ANSI何Unicode进行编译的单一源代码文件,必须包含TChar.h文件,而不是包含String.h文件。Tchar.h文件的唯一作用是帮助创建ANSI/Unicode通用源代码文件,它包含你应该用在源代码中的一组宏,而不应该直接调用str函数或wcs函数。如果在编译源代码文件中定义了_UNICODE,这些宏就会引用wcs这组函数,否则,引用str这组函数。

  • 若要定义一个ANSI/Unicode通用的字符串数组,请使用下面的TCHAR数据类型。如果定义了_UNICODE,TCHAR将声明为下面的形式:

    1
    typedef wchar_t TCHAR

    如果没有定义_UNICODE,则TCHAR将声明为下面的形式:

    1
    typedef char TCHAR

    使用该数据类型,可以向下面这样拍分配一个字符串:

    1
    TCHAR szString[100];

    也可以创建对字符串的指针:

    1
    TCHAR* szError = "Error"

    上面这行代码存在一个问题,如果没定义_UNICODE,该编译器将能正确的编译这一行代码;但是,如果定义了__UNICODE,将会产生一个错误。

    若要生成一个Unicode字符串而不是ANSI字符串,必须将该代码改写成下面的样子:

    1
    TCHAR* szError = L"Error";

    字符串前面的L用于告诉编译器该字符串作为Unicode字符串来编译,然而现在只有当定义了_UNICODE时程序才能正常编译。

    我们需要另一个宏,以便有选择的在字符串前面加上大写字母L。这项工作由_TEXT宏来完成,__TEXT宏也在TChar.h文件中做了定义。如果定义了__UNICODE,那么__TEXT定义成下面的形式:

    1
    #define _TEXT(X) L ## x

    如果没有定义,则定义成下面这种形式:

    1
    #define _TEXT(x) x
  • Windows定义了以下的一些Unicode数据类型:

    WCHAR: Unicode字符

    PWSTR 指向Unicode字符串的指针

    PCWSTR 指向一个恒定的Unicode字符串的指针

    这些数据类型是指Unicode字符和字符串,Windows头文件中也定义了ANSI/Unicode通用数据类型PTSTR和PCTSTR,这些数据类型既可以指ANSI字符串,也可以指Unicode字符串,这取决于当编译模块是否定义了UNICODE宏。